檢索結果:共9筆資料 檢索策略: "Bor-Shen Lin".ecommittee (精準) and cadvisor.raw="陳冠宇"
個人化服務 :
排序:
每頁筆數:
已勾選0筆資料
1
本論文研究了階層式及分類器混合這兩種複合式的分類器結構,用於提升音樂曲風分類之正確率。首先我們對輸入的樂曲分析出四種頻域特徵,分別是梅爾頻譜,梅爾倒頻譜,調變頻譜及打擊音效頻譜,作為基礎聲學特徵;然…
2
近年來,多語言問答已經成為一項新興的研究議題,並引起了廣泛的關注。仰賴於各種基於深度學習的先進技術,面向英文及其他資源豐富的語言所開發的系統有著高度的發展,但面向資源匱乏的語言時,這些技術大多因為資…
3
本論文針對口語問答系統之需求,在BERT(Bidirectional Encoder Representations from Transformers)的架構上,將文本與音訊特徵一起學習,並命名為…
4
關鍵詞檢測系統是智慧裝置中重要的人機互動媒介。然而,要求關鍵詞檢測模型在少量參數的情況下,依然擁有著強健的性能表現,是非常具有挑戰性的。因此,在本論文中,我們設計了一個新穎的輕量化關鍵詞檢測模型-C…
5
自動語音辨識模型(Automatic speech recognition, ASR)的目的是將語音訊號轉換為對應的文字,其對聲學的特徵和文字的前後文意有著很強的學習能力才能夠整合語音與文字兩個模態…
6
基於 Transformer 的模型在各大研究領域中都帶來了重大的創新,例如:語音訊號處理、自然語言處理和計算機視覺等。在 Transformer 被提出之後,基於注意力機制的端到端自動語音識別模型…
7
近幾年來,隨著網路的發達,每天都有成千上萬張新圖片或新影片產生,如何快速檢索出我們需要的資料,儼然成為一個熱議的問題,而此類問題可統稱為「圖片檢索」。圖片檢索的意義在於找出與檢索(Query)相似或…
8
近年來各式聲控家電的技術與產品正蓬勃發展,而在這些應用中的一項重要元件是分辨一段輸入的語音是出自於主人還是陌生人,並根據辨識結果,服務才會進行後續的反應或回饋。這項重要元件即是自動語者辨識系統。為了…
9
我們研究了變造的查詢歌曲檢索資料庫歌曲之相關問題,輸入之查詢歌曲可能經過音調升降與播放速度改變的變造處理。關於聲學特徵,我們以前人的三頻譜頂點頻率值為基礎,研究了調性近似值估計及音高正規化的方法,來…